人体内的药物与靶标相互作用 (DTI) 在生物医学科学和应用中起着至关重要的作用。由于每年在生物医学领域都有数百万篇论文发表,从生物医学文献中自动发现 DTI 知识(通常由关于药物、靶标及其相互作用的三元组组成)成为业界的迫切需求。现有的发现生物知识的方法主要是提取方法,这些方法通常需要详细的注释(例如,所有生物实体的提及、每两个实体提及之间的关系等)。然而,由于需要生物医学领域的专家知识,因此获取足够的注释非常困难且成本高昂。为了克服这些困难,我们使用生成方法探索了此任务的第一个端到端解决方案。我们将 DTI 三元组视为一个序列,并使用基于 Transformer 的模型直接生成它们,而无需使用实体和关系的详细注释。此外,我们提出了一种半监督方法,该方法利用上述端到端模型来过滤未标记的文献并对其进行标记。实验结果表明,我们的方法在 DTI 发现方面的表现明显优于提取基线。我们还创建了一个数据集 KD-DTI 来推进这项任务,并将其发布给社区。